Conjunto de datos flor iris

Diagrama de dispersión del conjunto de datos

El conjunto de datos flor Iris o conjunto de datos iris de Fisher es un conjunto de datos multivariante introducido por Ronald Fisher en su artículo de 1936, The use of multiple measurements in taxonomic problems (El uso de medidas múltiples en problemas taxonómicos) como un ejemplo de análisis discriminante lineal.[1]​ A veces, se llama Iris conjunto de datos de Anderson porque Edgar Anderson coleccionó los datos para cuantificar la variación morfológica de la flor Iris de tres especies relacionadas.[2]​ Dos de las tres especies se coleccionaron en la Península de la Gaspesia «todos son de la misma pastura, y recolectado el mismo día y medidos al mismo tiempo por la misma persona con el mismo aparato».[3]

El conjunto de datos contiene 50 muestras de cada una de tres especies de Iris (Iris setosa, Iris virginica e Iris versicolor). Se midió cuatro rasgos de cada muestra: el largo y ancho del sépalo y pétalo, en centímetros. Basado en la combinación de estos cuatro rasgos, Fisher desarrolló un modelo discriminante lineal para distinguir entre una especie y otra.

  1. R. A. Fisher (1936). «The use of multiple measurements in taxonomic problems». Annals of Eugenics 7 (2): 179-188. doi:10.1111/j.1469-1809.1936.tb02137.x. Archivado desde el original el 28 de septiembre de 2011. Consultado el 1 de septiembre de 2015. 
  2. Edgar Anderson (1936). «The species problem in Iris». Annals of the Missouri Botanical Garden 23 (3): 457-509. JSTOR 2394164. 
  3. Edgar Anderson (1935). «The irises of the Gaspé Peninsula». Bulletin of the American Iris Society 59: 2-5. 

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search